Cross-Tabulation Analysis(chi-squared distribution)

교차분석(Cross-Tabulation Analysis)
범주형 자료(명목, 서열) 갈의 관계를 분석할 때 사용한다.
카이제곱 검정 통계량을 이용

적합도 검정, 독립성 검정, 동질성 검정에 사용
교차 분석표(Cross-Tabulation Analysis Table)
두 범주형 변수를 교차하여 데이터의 빈도를 표 형태로 나타낸 표
A사 B사 C사
한국 30 55 15 100
미국 40 60 20 120
유럽 40 35 15 90
110 150 50 300
1. 적합도 검정
실험결과 얻어진 관측값이 예상값과 일치하는지 여부를 검정하는 방법

실험 데이터: 관측도수, 예측값: 기대도수
적합도 검정에서의 가설
H0: 실제 분포와 예측 분포 간에는 차이가 없다.(두 분포가 일치한다.)
H1: 실제 분포와 예측 분포 간에는 차이가 있다.(두 분포가 일치하지 않는다.)

적합도 검정의 유의수준은 보통 alpha=0.05
적합도 검정의 기각값은 카이제곱 분포표에서 유의수준 alpha=0.05일 때,
자유도 df=범주수-1에 해당하는 chi^2a(df)이다.
2. 독립성 검정
모집단의 두 개의 변수에 의해 범주화 됐을 때, 두 변수들 사이의 관계가 독립적인지 아닌지를 검정

변수들 사이의 관계가 독립적이라면, 유의한 관계가 없다고 판단
변수들 사이의 관계가 독립적이지 않다면, 유의한 관계가 있다고 판단한다.

카이제곱 검정에 의한 독립성 검정은 변수간의 관계 유무만 말해줄 뿐,
변수 간 관계의 강도를 말해주지는 않는다.(상관관계 분석을 통해 수치를 판별)
3. 동질성 검정
정해진 범주 내에서 서로 비슷하게 나타나고 있는지를 검정

두 집단이 동일한 모집단에서 추출된 것인지를 검정